簡介:本課介紹數據預處理過程體系,包括數據類型與采集、文本轉化與抽取、數據集成與規約、中文分詞、數據清洗、特征提取與變換、特征向量化、特征降維、特征選擇、可視化、詞典模型、TF-IDF向量模型、主題模型等。
- 課程須知
- 1、本課程面向一定編程基礎的計算機專業、軟件工程專業、通信專業、電子技術專業和自動化專業的學生。 2、本課程也適用于大數據從業者及人工智能相關工程人員。 3、任何有興趣的同學均適合學習。
- 老師告訴你能學到什么?
- 1、掌握不同分詞工具與適用場景 2、掌握文本特征選擇與提取方法
微信掃碼,參與3人拼團